模式识别与人工智能
2025年4月4日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2015, Vol. 28 Issue (1): 1-10    DOI: 10.16451/j.cnki.issn1003-6059.201501001
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
面向微博热点话题发现的多标签传播聚类方法研究*
陈羽中,方明月,郭文忠
福州大学 福建省网络计算与智能信息处理重点实验室 福州 350108
福州大学 数学与计算机科学学院 福州 350108
Research on Multi-Label Propagation Clustering Method for Microblog Hot Topic Detection
CHEN Yu-Zhong, FANG Ming-Yue, GUO Wen-Zhong
Fujian Provincial Key Laboratory of Network Computing and Intelligent Information Processing, Fuzhou University, Fuzhou 350108
College of Mathematics and Computer Science, Fuzhou University, Fuzhou 350108

全文: PDF (568 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 微博热点话题发现是目前的研究热点.针对传统热词抽取方法难以适用于微博数据的问题,提出一种基于老化理论的词生命值计算模型用于热词抽取,并基于热词间的相关性构建词共现网络;针对传统的词聚类算法不能较好地解决话题间存在重叠热词以及时间效率不佳的问题,引入多标签传播思想,设计一种接近线性时间复杂度的多标签传播聚类算法(TCMLPA)用于词共现网络的热词聚类,获得热点话题集.实验结果表明,词生命值计算模型能够有效过滤噪声并提取热词,TCMLPA算法则能够在保证聚类结果稳定性的情况下,有效提高热点话题发现的精度和效率.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
陈羽中
方明月
郭文忠
关键词 微博热点话题发现老化理论热词抽取多标签传播    
Abstract:With the rapid growth of microblog data, extracting hot topics from vast amounts of microblog posts has become a research hotspot. The traditional methods for hot term extraction can hardly apply to microblog data, thus a life value calculation model based on aging theory is established to extract hot terms. Then, a hot term co-occurrence network is built based on the correlations between hot terms. Aiming at the problem that traditional clustering methods can hardly handle the hot term overlap between different topics and can not deal with vast amounts of data efficiently, a term clustering method based on multi-label propagation algorithm (TCMLPA), which has a nearly linear time complexity, is proposed to detect hot topics in hot term co-occurrence network.The experimental results show that life value calculation model can filter noise and extract hot terms effectively. Meanwhile, TCMLPA ensures the stability of clustering result and improves the accuracy and efficiency of hot topic detection.
Key wordsMicroblog    Hot Topic Detection    Aging Theory    Hot Term Extraction    Multi-label Propagation   
收稿日期: 2013-12-16     
ZTFLH: TP 391  
基金资助:国家自然科学基金项目(No.61103175)、福建省教育厅重点项目(No.JK2012003)、福建省科技创新平台项目(No.2009J1007)、福建省自然科学基金项目(No.2013J01232)资助
作者简介: 陈羽中,男,1979年生,博士,副教授,主要研究方向为计算智能、复杂网络、数据挖掘等.E-mail:yzchen@fzu.edu.cn.方明月,女,1989年生,硕士研究生,主要研究方向为复杂网络、数据挖掘.郭文忠(通讯作者),男,1979年生,博士,教授,主要研究方向为计算智能及其应用.E-mail:guowenzhong@fzu.edu.cn.
引用本文:   
陈羽中,方明月,郭文忠. 面向微博热点话题发现的多标签传播聚类方法研究*[J]. 模式识别与人工智能, 2015, 28(1): 1-10. CHEN Yu-Zhong, FANG Ming-Yue, GUO Wen-Zhong. Research on Multi-Label Propagation Clustering Method for Microblog Hot Topic Detection. , 2015, 28(1): 1-10.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201501001      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2015/V28/I1/1
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn